查看原文
其他

上课啦!总体率的95%可信区间估计及SPSS操作

2017-04-24 杨超 医咖会

上一节统计课,我们学习了如何进行样本率间的多重比较,大家消化的如何?(具体内容见:出题啦!样本率间的多重比较,来看看别人的答案!


这次我们来学习总体率的区间估计及SPSS相关操作。老师依旧在黑板上抛出了一道例题:


为了解青少年龋齿的患病情况,某研究在当地随机抽取了800名青少年进行调查,经口腔医生检查后,共有200人患有龋齿,患病率为25.0%。试问当地青少年总体龋齿患病率的95%可信区间是多少?


老师:哪位同学能说一下什么是总体率的可信区间?


小张:我知道!总体率的估计包括了点估计区间估计。点估计是用样本率直接估计总体率,没有考虑抽样误差。区间估计则考虑抽样误差,按一定可信度(即1-α)估计总体率的可能范围,这就是总体率的可信区间。


老师别看小张头发少,基础知识真是好!哪位同学能说说总体率的可信区间估计方法有哪几种?


小陈:有查表法正态近似法。当样本含量(n)较小,如n≤50,特别是样本率(p)接近0或1时,可以采用查表法获得总体率的95%和99%可信区间。


当n足够大,p和1-p均不太小时(一般要求np与n(1-p)均大于5),样本率的抽样分布近似服从正态分布,此时可以用正态分布理论估计总体率的可信区间。


老师小陈不仅身体壮,头脑依然这么棒!我们请其他同学来介绍一下正态近似法的计算公式,并算一下本例的结果。


小咖:老师,我来!率的抽样误差大小用率的标准误(Sp)表示:


总体率的95%可信区间计算公式如下:


本例中n=800,p=25.0%,代入公式计算得Sp=0.0153,因此当地青少年总体龋齿患病率的95%可信区间为0.25±1.96×0.0153,即(22.0%,28.0%)。


老师:统计问题小咖帮,智慧颜值双担当!我们手算得到了总体率的95%可信区间,SPSS软件能否计算出结果呢?


大黄:必须能!在SPSS软件中录入数据如下:



(1)发生情况中,发生龋齿录为1,未发生录为0;总样本均录为1;同时录入发生和未发生龋齿的人数。


(2)对发生人数进行加权:Data→Weight Cases,将人数放入Frequency Variable框中→OK。



(3)选择Analyze→Descriptive Statistics→Ratio。



(4)将发生情况放入Numerator(分子)框中,总样本放入Denominator(分母)框中。



(5)点击Statistics,勾选Mean和Confidence intervals,Level(%):95即可→Continue→OK。



结果如下,用SPSS软件算出来的总体龋齿患病率的95%可信区间为(22.0%,28.0%),与手算的结果一致!



老师:很好,很正确!下课!


大黄:……


注:当样本率过高或过低,采用SPSS软件计算总体率的可信区间时,可能会出现可信区间的上限超过1或者下限低于0的情况。这是因为SPSS采用正态分布的方式来拟合二项分布,此时可以采用SAS软件进行总体率的区间估计。


(小咖注:除了统计学方法,杨老师的作诗能力也值得好好学习啊~)


统计学精彩教程回顾

1. 【合集】23种统计方法的SPSS详细操作

2. 出题啦!样本率间的多重比较,来看看别人的答案!

3. 【合集】7种类型的样本量计算方法,值得收藏!

医咖会微信:medieco-ykh

关注医咖会,轻松学习统计学!


有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进统计讨论群和其他小伙伴们一起交流学习;或者点击公众号下方自定义菜单的“统计咨询”,提出你遇到的统计难题。


点击左下角“阅读原文”,看看既往小伙伴们都提出了哪些问题,以及该如何去解决,也许正好有你疑惑的问题呢~

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存